马斯克评视频生成模型Sora:人类认赌服输;OpenAI的GPT商标申请遭拒;传英伟达大幅缩短AI GPU交付周期| 极客头条
「极客头条」—— 技术人员的新闻圈!
CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。
一分钟速览新闻点!
曝小米 14 Ultra 等将基于大模型做高倍率超分算法
芒果 TV 原生应用上架 Vision Pro
周鸿祎:Sora 意味着 AGI 实现将从 10 年缩短到 1 年
OPPO 陈明永发内部信:AI 手机元年到来,手机行业将进入第三阶段
马斯克评 OpenAI 首个视频生成模型:人类认赌服输
Google 宣布 Gemini 1.5
美国专利商标局拒绝了 OpenAI 的 GPT 商标申请
谷歌内部编码 AI 大语言模型 Goose 曝光
瑞银称英伟达大幅缩短 AI GPU 交付周期,从 8-11 个月降至 3-4 个月
Android 15 新增“通知冷却”功能
苹果停止签署 iOS 17.3 版本:已升级用户无法降级
国内要闻
曝小米 14 Ultra 等将基于大模型做高倍率超分算法
小米 14 Ultra 和 vivo X100 Ultra 等新机将基于 AI 大模型优化高倍率超分算法,以提升拍照效果。这些新机预计将搭载顶级配置,如 5000 万像素索尼 LYT900 主摄和多款旗舰平板将搭载天玑 9300 AI 芯片,融入 AI 技术,提供更智能便捷的使用体验。小米 14 Ultra 将在本月底的 MWC 2024 大会上亮相。
芒果 TV 原生应用上架 Vision Pro
芒果 TV 推出了一款名为「芒果 TV-Vision」的原生应用,专门为苹果 Vision Pro 头显设计,已在苹果 App Store 上架。该应用支持沉浸弹幕,界面遵循苹果官方 3D 纵深设计,提供热播剧集、热门片单和个人资料等功能。随着厂商对苹果 Vision Pro 头显的积极适配,预计未来将会有更多国内厂商跟进推出相关应用。
周鸿祎:Sora 意味着 AGI 实现将从 10 年缩短到 1 年
周鸿祎认为,Sora 意味着 AGI 实现将从 10 年缩短到 1 年。他分析说,OpenAI 训练这个模型应该会阅读大量视频,大模型加上 Diffusion 技术需要对这个世界进行进一步了解,学习样本就会以视频和摄像头捕捉到的画面为主。一旦人工智能接上摄像头,把所有的电影都看一遍,把 YouTube 上和 TikTok 的视频都看一遍,对世界的理解将远远超过文字学习,一幅图胜过千言万语,而视频传递的信息量又远远超过一幅图,这就离 AGI 真的就不远了,不是 10 年 20 年的问题,可能一两年很快就可以实现。(证券时报)
OPPO 陈明永发内部信:AI 手机元年到来,手机行业将进入第三阶段
春节假期后开工首日,OPPO 创始人兼 CEO 陈明永发布一封主题为《开启 AI 手机新时代》的内部信。他表示,2024 年是 AI 手机元年。未来五年,AI 对手机行业的影响,完全可以比肩当年智能手机替代功能机。在陈明永看来,从行业发展阶段来看,AI 手机也将成为继功能机、智能手机之后,手机行业的第三阶段。“这是我们对于手机行业的一个重大判断。”他说,通过 AI,可以把手机的体验重新做一遍,帮助用户实现更高价值。显然,这轮由大模型支撑的 AI 技术,正在重构手机行业的未来。“我相信,站在两年后看 2024 年,会更加深入地理解这一判断的意义。”(新浪科技)
国际要闻
马斯克评 OpenAI 首个视频生成模型 Sora:人类认赌服输
OpenAI 周四发布了首个视频生成模型 Sora。一位 X 用户分享了 Sora 生成的一名女子在东京街头漫步的视频,并评论称:“OpenAI 今天宣布了 Sora,它使用混合扩散和变压器模型架构生成长达 1 分钟的视频。他们似乎又领先了其他所有人1-2年。”另一位 X 用户评论称:“gg 皮克斯。”马斯克回应称:“gg 人类。”(注:gg 是网络游戏用语“good games”的缩写,主要用于游戏结束后,输赢双方都可以用,但现在多由失败方发出,表示认赌服输、心服口服的意思。)(环球市场播报)
Google 宣布 Gemini 1.5
Google 大模型以及 AI 聊天机器人都采用 Gemini 这一名称。目前的大模型版本号是 1.0,它的付费版叫 Gemini Advanced,用户可以访问 1.0 Pro 和 1.0 Ultra——其中 1.0 Ultra 是类似 GPT-4 的规模最大的模型,而 1.0 Pro 是类似 GPT-3.5 的中等规模模型。现在 Google 宣布了下一代的 Gemini 1.5,表示其中等规模模型 1.5 Pro 在性能上接近了上一代最大模型 1.0 Ultra,上下文窗口能达到 100 万 tokens,这意味着 1.5 Pro 能一次性处理 1 小时视频、11 小时音频、逾 3 万行代码,或逾 70 万单词。Gemini 1.5 是基于 Transformer 和 MoE 架构,感兴趣的用户需要申请加入等待名单。
美国专利商标局拒绝了 OpenAI 的 GPT 商标申请
美国专利商标局(USPTO)拒绝了 OpenAI 的 GPT 商标申请,认为 GPT 属于描述性术语,不能注册为商标。GPT 代表 Generative pre-trained transformers,是一种深度神经网络架构,基于 Google 研究员在 2017 年公布的深度学习架构 Transformers。OpenAI 申请商标旨在禁止其他人将其模型称为 GPT X 或后缀为 GPT 的名字。USPTO 去年 10 月已经拒绝了一次,这次是最终裁决,它认为 GPT 没有达到注册商标的标准。而 OpenAI 认为它让 GPT 这一名字变得家喻户晓。USPTO 指出 GPT 已在其他情景被其他公司使用。
谷歌内部编码 AI 大语言模型 Goose 曝光
谷歌内部研发了一款名为「Goose」的 AI 大语言模型,用于提高员工编写代码效率,加速产品研发,目前仅限谷歌员工使用。Goose 能回答技术问题,编写代码,提供自然语言的代码编辑提示,是谷歌将 AI 融入产品开发的重要一环。业界认为,Goose 的推出将提升谷歌产品开发效率,增强其在 AI 领域的竞争优势,并可能启发其他企业开发类似工具。
瑞银称英伟达大幅缩短 AI GPU 交付周期,从 8-11 个月降至 3-4 个月
根据瑞银分析师近日分享给投资者的备忘录,英伟达大幅缩短了 AI GPU 的交付周期,从去年年底的 8-11 个月缩短到了现在的 3-4 个月。机构认为英伟达大幅缩短 AI GPU 交付周期存在两种可能:该公司正在规划新的方案提高产能,满足未来的订单;而另一种可能是英伟达目前已具备足够的产能,可以处理积压的订单,当然不排除两个因素叠加的效果。
程序员专区
Android 15 新增“通知冷却”功能
在最近发布的 Android 15 首个开发者预览版中,谷歌推出了一项名为“通知冷却”的新功能。谷歌官方对“通知冷却”的描述是,“当您收到来自同一应用的许多连续通知时,会逐渐降低通知音量”。具体来说,当同一应用或对话首次发送通知时,手机声音音量仍会保持正常,但随后来自同一来源的后续通知音量将会逐渐降低。值得注意的是,这些重复通知并不会完全静音,而是通过音量变化提醒用户它们来自同一来源。
苹果停止签署 iOS 17.3 版本:已升级用户无法降级
苹果停止签署iOS 17.3,阻止已升级用户降级到该版本。在2月8日发布的iOS 17.3.1之后,iOS 17.3不再签名,该更新添加了对文本相关错误的修复。苹果通常会阻止用户安装旧版本的iOS,以鼓励客户保持其操作系统的最新状态,并防止降级到较旧、安全性较低的iPhone操作系统版本。iOS 17.3.1现在是唯一公开发布的iOS版本,但苹果也在对iOS 17.4进行Beta测试,iOS 17.4正式版本将在今年3月发布,带来应用侧载(仅限欧盟地区)、播客改进、新Emoji等特性。
推荐阅读: